Insgesamt gibt es ca. 6500 bis 7000 Sprachen auf der Welt. Etwa die Hälfte der Erdbevölkerung sprechen eine der 10 meistgesprochenen Sprachen. Die sind Mandarin-Chinesisch, Englisch, Spanisch, Hindi, Arabisch, Portugiesisch, Bengali, Russisch, Japanisch und Deutsch.
Verschiedene Sprachen haben verschiedene Wortstellungsmöglichkeiten, zum Beispiel ist die Wortfolge auf Deutsch Subjekt-Verb-Objekt, wie im Satz “Ich koche Suppe.”, auf Japanisch ist die Wortfolge von diesem Satz jedoch Subjekt-Objekt-Verb:
Watashi wa su-pu wo tsukuru Ich Suppe kochen
Verschiedene Sprachen haben verschiedene Wortstellungsmöglichkeiten in Nominalphrasen, zum Beispiel die Wortstellung von Adjektiven und Nomen in Nominalphrasen. In Deutschen ist das Adjektiv vor dem Nomen, wie in der Nominalphrase “das feuchte Holz”, aber in Französischen kann das Nomen vor dem Adjektiv gestellt wird:
le bois humide das Holz feuchte
Jedoch kann man nicht sagen, dass die Sprachen auf der Welt keine Gemeinsamkeiten haben. Denn alle Sprachen haben Wörter und Sätze, Wörter werden aus elementaren bedeutungslosen Lauten oder Gesten gebildet, alle Sprachen haben komplexe morphologische und/oder syntaktische Strukturen, alle Sprachen haben Frageausdrücke und Verneinungsausdrücke usw.
Es lassen sich oft universale Behauptungen nur aufstellen, wenn eine weitere Bedingung erfüllt ist: Implikationsuniversalien (vgl.Croft 2002). “Wenn eine Sprache L die Eigenschaft A hat, dann hat sie auch die Eigenschaft B”
Beispielsweise “Wenn eine Sprache ein [f] Laut hat, dann hat sie auch ein [s] Laut; Wenn in einer Sprache das Objekt dem Verb vorangeht”Der Hund die Katze jagt“, dann steht auch der Besitzer vor dem Besitz”des Hundes Hütte“.
Nach dieser Theorie wird in dieser empirischen Arbeit den Zusammenhangen zwischen den Wortfolgen im Satz und den Wortstellungen in Nominalphrasen von den erhobenen 26 Sprachen untersucht, ob es nach dieser Theorie auch Ausnahme gibt und ob diese Zusammenhangen nach Statistik signifikant sind.
Diese Arbeit wird mit Statistik “R” geschrieben und alle Daten werden in “R” eingelesen und ausgewertet. Die Karten für die Übersichten von verschiedene Themen der erhobenen Sprachen werden mit “R” dargestellt.
Um den Zusammenhangen zwischen der Wortfolge im Satz und den Wortstellungen in Nominalphrasen in der Sprache herauszufinden, wurde einen Fragebogen mit 10-deutschen Sätzen an verschiedene Muttersprachler gegeben. Von Dezember 2017 bis Ende Februar 2018 wurden insgesamt 25 Fragebogen von Informanten zurückbekommen. Mit diesen 26 Sprachen (inklusiv Deutsch) werden die Implikationsuniversalien genau angeschaut.
Die Überlegungen zur Wahl der Personen war, dass wir nur die Muttersprachler suchen. Denn die L2-Leaner sind meistens unsicher und brauchen Lehrbücher oder Wörterbuch, um den Übersetzungsbögen ins anderen Sprachen zu übersetzen. Aber Muttersprachler können meistens die passenden Ausdrücken in ihrer Muttersprache besser finden.
Es ist beim Erheben optimal, wenn man die Sprachen von vielen Sprachfamilien als Quellen bekommen kann, am besten auch ein paar isolierte Sprachen oder die Sprachen mit wenige Sprecher dabei könnten. Die insgesamt erhobenen Sprachen sind: Deutsch, Englisch, Niederländisch, Französisch, Italienisch, Griechisch, Portugiesisch, Polnisch, Russisch, Ukrainisch, Rumänisch, Armenisch, Türkisch, Tigrinja, Hindi, Vietnamesisch, Indonesisch, Kroatisch, Georgisch, Berber, Persisch und Spanisch von Mexiko.
Obwohl es nur 26 Sprachen erhoben wurde, aber diese Sprachen sind gut auf den Sprachfamilien geteilt. Es gibt nicht nur Indoeuropäische Sprachen wie Deutsch, Englisch, Niederländisch, Französisch, Spanisch, Italienisch, Griechisch, Portugiesisch, Polnisch, Russisch, Ukrainisch, Rumänisch, Hindi, Kroatisch und Persisch, sondern auch die isolierten Sprachen wie Koreanisch, Japanisch und Chinesisch. Außerdem sind die Altaische Sprachen wie Türkisch, Afroasiatische Sprachen wie Tigrinja und Berber, Sinotibetische Sprachen wie Kantonesisch, Austroasiatische Sprache wie Vietnamesisch, Austronesisch wie Indonesisch und Südkaukasische Sprachen wie Georgisch (vgl. Wals.info).
Im Folgenden werden die Daten von den erhobenen Sprachen in “R” eingelesen und schließlich wird eine Karte für eine Übersicht der erhobenen Sprachen mit diesen Daten dargestellt.
Die Analyse von den erhobenen Sprachen ist als “Umfragedaten.csv” unter Ordner “sources” gespeichert. Hier wird es mit “read.csv()” in R eingelesen und als “Daten” genannt. Mit der Funktion “summary()” kann man die Strukturen von der Datei anschauen.
Daten <- read.csv ("//Users/verawei/Desktop/HA Sprachtypologie/sources/Umfragedaten.csv"
, header = TRUE
, sep = ";")
summary(Daten)
## Sprache Land Gattung Familie
## Armenisch : 1 China : 2 Romance : 5 Indoeuropäisch :16
## Berber : 1 Iran : 2 Slavic : 4 Afroasiatisch : 2
## Chinesisch : 1 Deutschland : 1 Germanic: 3 Altaisch : 1
## Deutsch : 1 England : 1 Armenian: 1 Austroasiatisch: 1
## Englisch : 1 Ethiopia Eritrea: 1 Berber : 1 Austronesisch : 1
## Französisch: 1 Frankreich : 1 Chinese : 1 Chinesisch : 1
## (Other) :20 (Other) :18 (Other) :11 (Other) : 4
## Latitude Longitude Wortfolge Adjektiv.Nomen
## Min. : 0.00 Min. :-99.38 SOV: 6 Adj+N :17
## 1st Qu.:32.17 1st Qu.: 10.50 SVO:20 N+Adj : 7
## Median :39.00 Median : 34.00 No domiant order: 2
## Mean :36.66 Mean : 41.68
## 3rd Qu.:47.50 3rd Qu.: 71.25
## Max. :56.00 Max. :140.00
##
## Musik.Mozart Artikel.Nomen Farbe.Nomen Numeral.Nomen
## MoMu : 9 DET+N :23 Fa+N:18 Num+N:26
## MuMo :15 N+DET : 2 N+Fa: 8
## nicht klar: 2 nicht klar: 1
##
##
##
##
## Artikel.Farbe Artikel.Numeral Artikel.Adjektiv Farbe.Adjektiv
## DET+Fa :18 DET+Num :21 Adj+DET : 2 Adj+Fa:20
## Fa+DET : 1 nicht klar: 1 DET+Adj :22 Fa+Adj: 6
## nicht klar: 7 Num+DET : 4 nicht klar: 2
##
##
##
##
## Adjektiv.Adjektiv.Umfang
## Adj-U+Adj : 8
## Adj+Adj-U :16
## nicht klar: 2
##
##
##
##
Mit der Darstellung kann man die Strukturen von der Analysedatei klar verstehen. Der erste Spalt von der Datei sind die 26 erhobenen Sprachen und das erste Ziel von der Datei sind die 17 Verteilungen: “Sprache”, “Land”, “Gattung”, “Familie”, “Latitude”, “Longitude”, “Wortfolge”, “Adjektiv + Nomen”, “Musik + Mozart”, “Artikel + Nomen”, “Farbe + Nomen”, “Numerale + Nomen”, “Artikel + Farbe”, “Artikel + Numerale”, “Artikel + Adjektiv”, “Farbe + Adjektiv” und “Adjektiv + Adjektiv_Umfang”.
In der Karte 1 werden alle erhobenen Sprachen nach ihrer Räumlichkeit auf der Weltkarte dargestellt. Die Karte 1 zeigt, dass die erhobene Sprachen gut auf der ganzen Welt geteilt sind. Die meisten Sprachen sind europäische Sprachen, aber asiatische und afrikanische Sprachen sind auch dabei.
library(maps)
map("world", interior=FALSE, col="grey", resolution=0)
points(Daten$Longitude, Daten$Latitude
, col = "red"
, cex =.7
, pch = 20)
title (main = "Übersicht der erhobenen Sprachen ")
In Folgender Karte 2 werden diese erhobenen Sprachen nach ihrer Sprachfamilie dargestellt. Mit dieser Darstellung kann man einen besseren Überblick über die Sprachen und ihre zusammengehörige Sprachfamilie bekommen. Die erhobenen Sprachen sind gut auf den Sprachfamilien geteilt.
table(Daten$Familie)
##
## Afroasiatisch Altaisch Austroasiatisch Austronesisch
## 2 1 1 1
## Chinesisch Indoeuropäisch Japanisch Koreanisch
## 1 16 1 1
## Sinotibetisch Südkaukasisch
## 1 1
Mit der Funktion “table()” bekommt man die Verteilung der Datei in “R”. Es zeigt, dass es insgesamt 16 Indoeuropäische Sprachen und zwei Afroasiatische Sprachen gibt. Außerdem sind die Sprachfamilie Südkaukasische Sprachen, Altaische Sprachen, Austroasiatische Sprachen, Austronesische Sprache, Sinotibetische Sprachen, Chinesisch, Japanisch und Koreanisch auch dabei. Darüber hinaus kann man sagen, dass die erhobenen 26 Sprachen sehr vielfältig sind.
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("darkgreen", "blue", "yellowgreen", "gold", "purple", "red", "deepskyblue2", "darkblue", "darkorchid1", "green3")
mycols <- cols[Daten$Familie]
mysymbols <- c(20, 20, 20, 20, 20, 20, 20, 20, 20, 20)
Sprachefamilie <- mysymbols[Daten$Familie]
myname <- c("Afroasiatisch", "Altaisch", "Austroasiatisch", "Austronesisch", "Chinesisch", "Indoeuropäisch", "Japanisch", "Koreanisch", "Sinotibetisch", "Südkaukasisch")
points(Daten$Longitude, Daten$Latitude
, pch = Sprachefamilie
, col = mycols
)
title(main = "Übersicht der erhobenen Sprachen nach der Sprachfamilie")
legend ("bottomleft"
, legend = myname
, pch = Sprachefamilie
, col = cols
, cex = 0.7
, pt.cex = 1.5)
Um die Struktur von den Sprachen mit Farben darzustellen, habe ich zuerst mit der Funktion “table()” die Struktur von der Sprachfamilie angeschaut. Sodass ich die richtige Reihfolge von den Sprachen mit passenden Farben einordnen konnte. Die Auswahl von Farben für die Karte ist schwierig. Eine Seite sollten die näh zusammengehörige Sprachfamilie eine ähnliche Farbe bekommen, andere Seite sollten die Ortspunkte von Sprachen gut auffällig sind.
Dieser Übersetzungsbogen wurde von mir und zwei weiteren Studentinnen zusammengestellt. Mit diesem Übersetzungsbogen möchten wir herausfinden, wie bestimmte Sätze in verschiedene Sprachen aufgebaut sind, wie Superlativ und Modalpartikeln. Daher enthält der Übersetzungsbog folgende Zehn Sätze:
Ich interessiere mich über den Zusammenhang zwischen den Wortfolgen und den Wortstellungen in Nominalphrasen der Sprachen. Für meine Analyse sind nur folgende Satzteilen relevant:
Mit dem Satz 1 möchte ich die Wortfolgen im Satz von der Sprache festzustellen. Leider gibt es viele Sprachen, wenn der Subjekt im Satz “ich” ist, fällt den Subjekt weg und wird mit der Endung von Verb markiert. Daher habe ich die Wortfolgen von der Sprache immer auf alle gefragte zehn Sätzen berücksichtigt.
Mit Phrase “Musik von Mozart” wird die Genitiv-Nomen-Reihenfolge analysiert, damit wird die Reihenfolge für Genitiv-Nomen oder Nomen-Genitiv in der Sprache festgestellt. Mit den Satzteilen von Sätzen 4, 5, 9, 10 werden die Reihenfolgen von verschiedenen Elementen in der Nominalphrase der erhobenen Sprachen festgestellt.
Außerdem sind die Nominalphrasen von Sätzen 3, 4 und 5 den Direktobjekt, aber im Satz 9 und 10 sind die Nominalphrasen das Subjekt. Durch die Analyse von den erhobenen Sprachen zeigt es keine Unterschieden von der Wortstellung in Nominalphrasen von diesen fünf Sätzen (sehen Sie Daten von “Umfrage Analyse.xlsx”).
Die meisten Informanten sind meine Arbeitskollegen, Freunde oder Kommilitonen. Durch persönliche Gespräche, E-Mails und Nachtrichten von Facebook habe ich sie als Informanten gewonnen. Die Übersetzungsbogen sind entweder in ausgedrückten Papierformen an Informanten persönlich gegeben, oder als Word- und PDF-Datei an Informanten per E-Mail erreichtet. Die Informanten haben durchschnittlich ca. eine Woche gebraucht, bis sie mir die Übersetzungen zurückgeben.
Die Sprachen, wie Kroatisch, Armenisch und Rumänisch, hatten die Informanten weiterhin ihre Freunde für die Fragebogen geleitet. Zusammenfassende kann man sagen, dass Enkodierung der Informanten nicht sehr schwierig war. Denn sie sind sehr motiviert, ihre Muttersprache zu andren weiter zu erklären und die Unterschieden zwischen ihre Muttersprache und Deutsch besser zu erkennen.
Die Umfragebogen “Umfrage Studie Sprachtypologie” ist unten Ordner “Umfrage” zu finden. Außerdem sind noch 22 erhobene Umfragebogen auch in demselben Ordner zu finden.
Die Ergebnisse der Umfragesätze sind zuerst nach Sprache analysiert. Die Wortfolge in Sätzen und die Wortstellung im Nominalphrasen sind nach jeder Sprache sehr genau berücksichtigt. Die Ergebnisse sind als Excel-Datei “Umfrage Analyse” unter Ordner sources zu finden.
Für die Analyse in R wird die Excel-Datei “Daten_Umfrage” genutzt. In dieser Analyse sind Sprache nach Land, Gattung und Familie zuerst geachtet. Außerdem sind Longitude und Latitude von der Sprache nach Wals.info für das Erstellen der Karte geachtet. Die Analyse von Daten sind außer Wortfolge unter sehr viele kleine Elementpaare geteilt, wie “Adjektiv + Nomen”, “Musik + Mozart”, “Artikel + Nomen”, “Farbe + Nomen”, “Numerale + Nomen”, “Artikel + Farbe”, “Artikel + Numerale”, “Artikel + Adjektiv”, “Farbe + Adjektiv” und “Adjektiv + Adjektiv-Umfrang”.
Im Folgenden werden nicht nur die Verteilung der Wortfolge von Subjekt, Objekt und Verb der erhobenen Sprachen in Weltkarte dargestellt, sondern auch die Wortstellungen in Nominalphrasen und die Reihenfolge von verschiedenen Arten der Adjektive in Nominalphrase der erhobenen Sprachen.
Für die Wortfolgen von Subjekt, Objekt und Verb werden nicht nur nach dem Satz 1 “Ich koche Suppe” festgestellt, sondern auch alle weitere neun Sätze von Umfragebogen.
table(Daten$Wortfolge)
##
## SOV SVO
## 6 20
Mit der Funktion “table()” können wir die Verteilung der Wortfolge von der erhobenen Sprachen sehen. In diesen Sprachen gibt es insgesamt sechs Sprache, die “Subjekt-Objekt-Verb (SOV)” Wortfolge haben und insgesamt 20 Sprache, die “Subjekt-Verb-Objekt (SVO)” Wortfolge haben.
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("blue", "red")
mycols <- cols[Daten$Wortfolge]
mysymbols <- c(20, 20)
Wortfolge <- mysymbols[Daten$Wortfolge]
freq <- table(Daten$Wortfolge)
myname <- c(
paste0("SOV-Sprache (", freq[1], ")")
, paste0("SVO-Sprache (", freq[2], ")")
)
points(Daten$Longitude, Daten$Latitude
, pch = Wortfolge
, col = mycols)
title(main = "Die Wortfolge von Subjekt, Objekt und Verb
der erhobenen Sprachen")
legend ("bottomleft"
, legend = myname
, pch = Wortfolge
, col = cols
, cex = 0.7
, pt.cex = 1.5)
Auf der Karte 3 “Die Wortfolge von Subjekt, Objekt und Verb der erhobenen Sprachen” sind alle 6 SOV-Sprache in blauen Pünktchen und alle 20 SVO-Sprache in roten Pünktchen auf der Weltkarte geteilt. Diese Karte gibt man einen guten Überblick über die Verteilung von Wortfolge von allen erhobenen Sprachen.
Die Wortstellungen in Nominalphrasen werden die Elemente immer im Pärchen vergleicht und dargestellt: die Reihenfolge von Adjektiv und Nomen in Nominalphrase, die Reihenfolge von Artikel und Nomen in Nominalphrase, die Reihenfolge von Farbe und Nomen in Nominalphrase, die Reihenfolge von Numerale und Nomen in Nominalphrase und die Reihenfolge von Genitiv und Nomen in Nominalphrase. Außerdem werden die Wortstellungen von den verschiedenen Arten der Adjektive in Nominalphrase auch dargestellt: die Reihenfolge von Artikel und Farbe, die Reihenfolge von Artikel und Numerale, die Reihenfolge von Artikel und Adjektiv, die Reihenfolge von Farbe und Adjektiv und die Reihenfolge von Adjektiv und Umfangsadjektiv in Nominalphrasen.
Um die Reihenfolge von Adjektiv und Nomen von den erhobenen Sprachen festzulegen, wurden diesen Satzteilen berücksichtigt: “große Häuser”, “schönen großen Ball”, “kleine Hunde” und “feuchtes Holz”. Nur wenn die Reihenfolge von Adjektiv und Nomen in diesen vier Satzteilen identisch sind, wurde die Reihenfolge von Adjektiv und Nomen in Nominalphrase der Sprache bestimmt.
table(Daten$Adjektiv.Nomen)
##
## Adj+N N+Adj No domiant order
## 17 7 2
Mit Funktion “table()” sehen wir, dass insgesamt 17 Sprachen eine Reihenfolge “Adjektiv vor dem Nomen” in Nominalphrase haben, und 7 Sprachen eine Reihenfolgen “Nomen vor dem Adjektiv” in Nominalphrase haben. Außerdem gibt es zwei Sprachen, nämlich Französisch und Indonesisch, keine dominante Reihenfolge von Adjektiv und Nomen in Nominalphrase.
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("red", "blue", "green3")
mycols1 <- cols[Daten$Adjektiv.Nomen]
mysymbols <- c(20, 20, 20)
AdjNon <- mysymbols[Daten$Adjektiv.Nomen]
myname <- c("Adjektiv vor Nomen (17)", "Nomen vor Adjektiv (7)", "Beides (2)")
points (Daten$Longitude, Daten$Latitude
, pch = AdjNon
, col = mycols1)
title(main = "Die Reihenfolge von Adjektiv und Nomen in Nominalphrase")
legend ("bottomleft"
, legend = myname
, pch = AdjNon
, col = cols
, cex = 0.7
, pt.cex = 1.5)
Auf der Karte 4 “Die Reihenfolge von Adjektiv und Nomen in Nominalphrase” werden die 17 Sprachen mit der Reihenfolge “Adjektiv vor Nomen” in roten Pünktchen markiert und 7 Sprachen mit der Reihenfolge “Nomen vor Adjektiv” in blauen Pünktchen markiert. Mit grünen Pünktchen sind die Französischen und Indonesischen markiert.
In Französisch sind die Reihenfolge von Adjektiv und Nomen in Nominalphrase nicht immer gleich, wie zum Beispiel: - Artikel + Adjektiv + Nomen (als Subjekt) - les petits chiens - die kleinen Hunde
In Indonesischen wechselt sich die Reihenfolge von Adjektiv und Nomen in Nominalphrase auch immer wieder, beispielsweise: - Nomen + Adjektiv + Artikel - rumah besar ini - Häuser groß das
Dadurch dass die Reihenfolge von Adjektiv und Nomen in Nominalphrase für Französischen und Indonesischen beides möglich ist, wurden den Typ dieser Reihenfolge hier als “Beides” auf der Karte gestellt.
Die Wortstellung in Nominalphrasen “diese fünf großen Häuser” und “das feuchte Holz” wurden für die Festlegung der Reihenfolge von Artikel und Nomen in Nominalphrase angeschaut. Nur wenn die Reihenfolge von diesen zwei Nominalphrasen identisch sind, kann man ihre Reihenfolge festlegen.
table(Daten$Artikel.Nomen)
##
## DET+N N+DET nicht klar
## 23 2 1
Durch die Funktion “table()” sieht man, dass insgesamt 23 Sprachen eine Reihenfolge “Artikel vor Nomen” hat und nur in zwei Sprachen “Nomen vor Artikel” ist. In dem Übersetzungsbogen von Persisch gab es leider keinen Artikel, daher wurde diese Reihenfolge für Persischen als “nicht klar” dargestellt.
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("red", "blue", "green3")
mycols2 <- cols[Daten$Artikel.Nomen]
mysymbols <- c(20, 20, 20)
ArtNon <- mysymbols[Daten$Artikel.Nomen]
myname <- c("Artikel vor Nomen (23)", "Nomen vor Artikel (2)", "Nicht Klar (1)")
points (Daten$Longitude, Daten$Latitude
, pch = ArtNon
, col = mycols2)
title(main = "Die Reihenfolge von Artikel und Nomen in Nominalphrase")
legend ("bottomleft"
, legend = myname
, pch = ArtNon
, col = cols
, cex = 0.7
, pt.cex = 1.5)
Mit Karte 5 sehen wir, dass die dominante Reihenfolge von Artikel und Nomen der erhobenen Sprachen “Artikel vor Nomen” ist. Jedoch gibt es noch zwei Sprachen: Vietnamesisch und Indonesisch, in denen die dominante Reihenfolge “Nomen vor Artikel” ist. Wie in Nominalphrase “diese fünf großen Häuser”:
In Vietnamesisch: - Numerale + Nomen + Adjektiv + Artikel - năm ngôi nhà lớn này
- fünf Häuser großen dies
In Indonesischen: - Numerale + Nomen + Adjektiv + Artikel - lima rumah besar ini
- fünf Häuser groß das
table(Daten$Farbe.Nomen)
##
## Fa+N N+Fa
## 18 8
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("red", "blue")
mycols3 <- cols[Daten$Farbe.Nomen]
mysymbols <- c(20, 20)
FarbNon <- mysymbols[Daten$Farbe.Nomen]
myname <- c("Farbe vor Nomen (18)", "Nomen vor Farbe (8)")
points (Daten$Longitude, Daten$Latitude
, pch = FarbNon
, col = mycols3)
title(main = "Die Reihenfolge von Farbe und Nomen in Nominalphrase: roter Ball")
legend ("bottomleft"
, legend = myname
, pch = FarbNon
, col = cols
, cex = 0.7
, pt.cex = 1.5)
table(Daten$Numeral.Nomen)
##
## Num+N
## 26
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("blue", "red")
mycols4 <- cols[Daten$Numeral.Nomen]
mysymbols <- c(20)
NumNon <- mysymbols[Daten$Numeral.Nomen]
myname <- c("Numerale vor Nomen (26)", "Nomen vor Numerale (0)")
points (Daten$Longitude, Daten$Latitude
, pch = NumNon
, col = mycols4)
title(main = "Die Reihenfolge von Numerale und Nomen
in Nominalphrase: fünf Häuser")
legend ("bottomleft"
, legend = myname
, pch = NumNon
, col = cols
, cex = 0.7
, pt.cex = 1.5)
In allen erhobenen Sprachen sind Numeral vor Nomen in Nominalphrase “fünf Häuser”, hier gibt es keine Ausnahme.
table(Daten$Musik.Mozart)
##
## MoMu MuMo nicht klar
## 9 15 2
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("red", "blue", "green3")
mycols5 <- cols[Daten$Musik.Mozart]
mysymbols <- c(20, 20, 20)
MuMo <- mysymbols[Daten$Musik.Mozart]
myname <- c("Genitiv vor Nomen (9)", "Nomen vor Genitiv (15)", "Nicht klar (2)")
points (Daten$Longitude, Daten$Latitude
, pch = MuMo
, col = mycols5)
title(main = "Die Wortfolge von Genitiv und Nomen
in Nominalphrase: Musik von Mozart")
legend ("bottomleft"
, legend = myname
, pch = MuMo
, col = cols
, cex = 0.7
, pt.cex = 1.5)
table(Daten$Artikel.Farbe)
##
## DET+Fa Fa+DET nicht klar
## 18 1 7
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("blue", "red", "green3")
mycols6 <- cols[Daten$Artikel.Farbe]
mysymbols <- c(20, 20, 20)
ArtFa <- mysymbols[Daten$Artikel.Farbe]
myname <- c("Artikel vor Farbe (28)", "Farbe vor Artikel (1)", "Nicht klar (7)")
points (Daten$Longitude, Daten$Latitude
, pch = ArtFa
, col = mycols6)
title(main = "Die Reihenfolge von Artikel und Farbe
in Nominalphrase: einen roten Ball")
legend ("bottomleft"
, legend = myname
, pch = ArtFa
, col = cols
, cex = 0.7
, pt.cex = 1.5)
??? Warum so vile “nicht klar”
table(Daten$Artikel.Numeral)
##
## DET+Num nicht klar Num+DET
## 21 1 4
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("blue", "green3", "red")
mycols7 <- cols[Daten$Artikel.Numeral]
mysymbols <- c(20, 20, 20)
ArtNum <- mysymbols[Daten$Artikel.Numeral]
myname <- c("Artikel vor Numerale (21)", "Nicht klar (1)", "Numerale vor Artikel (4)")
points (Daten$Longitude, Daten$Latitude
, pch = ArtNum
, col = mycols7)
title(main = "Die Reihenfolge von Artikel und Numerale
in Nominalphrase: diese fünf Häuser")
legend ("bottomleft"
, legend = myname
, pch = ArtNum
, col = cols
, cex = 0.7
, pt.cex = 1.5)
table(Daten$Artikel.Adjektiv)
##
## Adj+DET DET+Adj nicht klar
## 2 22 2
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("blue", "red", "green3")
mycols8 <- cols[Daten$Artikel.Adjektiv]
mysymbols <- c(20, 20, 20)
ArtAdj <- mysymbols[Daten$Artikel.Adjektiv]
myname <- c("Adjektiv vor Artikel (22)", "Artikel vor Adjektiv (2)", "Nicht klar (2)")
points (Daten$Longitude, Daten$Latitude
, pch = ArtAdj
, col = mycols8)
title(main = "Die Reihenfolge von Artikel und Adjektiv
in Nominalphrase: das feuchte Holz")
legend ("bottomleft"
, legend = myname
, pch = ArtAdj
, col = cols
, cex = 0.7
, pt.cex = 1.5)
table(Daten$Farbe.Adjektiv)
##
## Adj+Fa Fa+Adj
## 20 6
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("blue", "red")
mycols9 <- cols[Daten$Farbe.Adjektiv]
mysymbols <- c(20, 20)
FaAdj <- mysymbols[Daten$Farbe.Adjektiv]
myname <- c("Adjektiv vor Farbe (20)", "Farbe vor Adjektiv (6)")
points (Daten$Longitude, Daten$Latitude
, pch = FaAdj
, col = mycols9)
title(main = "Die Reihenfolge von Adjektiv und Farbe
in Nominalphrase: schönen roten Ball")
legend ("bottomleft"
, legend = myname
, pch = FaAdj
, col = cols
, cex = 0.7
, pt.cex = 1.5)
table(Daten$Adjektiv.Adjektiv.Umfang)
##
## Adj-U+Adj Adj+Adj-U nicht klar
## 8 16 2
maps::map("world"
,interior = FALSE
, col = "grey"
, resolution = 0)
cols <- c("blue", "red", "green3")
mycols10 <- cols[Daten$Adjektiv.Adjektiv.Umfang]
mysymbols <- c(20, 20, 20)
AdjAdjU <- mysymbols[Daten$Adjektiv.Adjektiv.Umfang]
myname <- c("Umfangsadjektiv vor Adjektiv (8)", "Adjektiv vor Umfangsadjektiv (16)", "Nicht klar (2)")
points (Daten$Longitude, Daten$Latitude
, pch = AdjAdjU
, col = mycols10)
title(main = "Die Reihenfolge von Adjektiv und Umfangsadjektiv
in Nominalphrase: schönen großen Ball")
legend ("bottomleft"
, legend = myname
, pch = AdjAdjU
, col = cols
, cex = 0.7
, pt.cex = 1.5)
Vermutungen
Folge1 <- table(Daten$Wortfolge, Daten$Adjektiv.Nomen)
Folge1
##
## Adj+N N+Adj No domiant order
## SOV 5 1 0
## SVO 12 6 2
barplot (Folge1
, main = "Zusammenhang zwischen den Wortfolgen und
die Wortstellung des Adjektivs und Nomen"
)
Der Unterschied zwischen den Sprachen kann man auch mit einem Boxplot darstellen, aber das hilft nicht so viel, weil jeder Vokal anders ist.
mosaicplot(Folge1
, color = TRUE
, xlab = "Wortfolge"
, ylab = "Wortstllung der Adjektiv und Nomen"
, main = "Zusammenhang zwischen den Wortfolgen und
den Wortstellungen der Adjektiven und Nomen")
chisq.test(Folge1)
## Warning in chisq.test(Folge1): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: Folge1
## X-squared = 1.2891, df = 2, p-value = 0.5249
t.test(Folge1)
##
## One Sample t-test
##
## data: Folge1
## t = 2.4058, df = 5, p-value = 0.06118
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## -0.2968864 8.9635531
## sample estimates:
## mean of x
## 4.333333
???
cor.test(Folge1, Folge1)
##
## Pearson's product-moment correlation
##
## data: Folge1 and Folge1
## t = Inf, df = 4, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 1 1
## sample estimates:
## cor
## 1
Folge2 <- table(Daten$Wortfolge, Daten$Artikel.Nomen)
Folge2
##
## DET+N N+DET nicht klar
## SOV 5 0 1
## SVO 18 2 0
mosaicplot (Folge2
, color = TRUE
, xlab = "Wortfolgen"
, ylab = "Wortstellung von Artikel und Nomen"
, main = "Zusammenhang zwischen den Wortfolgen und
den Wortstellungen der Artikel und Nomen ")
chisq.test(Folge2)
## Warning in chisq.test(Folge2): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: Folge2
## X-squared = 3.9565, df = 2, p-value = 0.1383
t.test(Folge2)
##
## One Sample t-test
##
## data: Folge2
## t = 1.5278, df = 5, p-value = 0.1871
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## -2.957538 11.624205
## sample estimates:
## mean of x
## 4.333333
cor.test(Folge2, Folge2)
##
## Pearson's product-moment correlation
##
## data: Folge2 and Folge2
## t = Inf, df = 4, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 1 1
## sample estimates:
## cor
## 1
Folge3 <- table(Daten$Wortfolge, Daten$Farbe.Nomen)
Folge3
##
## Fa+N N+Fa
## SOV 5 1
## SVO 13 7
mosaicplot (Folge3
, color = TRUE
, xlab = "Wortfolgen"
, ylab = "Wortstellung von Farbe und Nomen"
, main = "Zusammenhang zwischen den Wortfolgen und
den Wortstellungen der Farbe und Nomen ")
chisq.test(Folge3)
## Warning in chisq.test(Folge3): Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: Folge3
## X-squared = 0.12187, df = 1, p-value = 0.727
t.test(Folge3)
##
## One Sample t-test
##
## data: Folge3
## t = 2.6, df = 3, p-value = 0.08038
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## -1.456116 14.456116
## sample estimates:
## mean of x
## 6.5
Folge4 <- table(Daten$Wortfolge, Daten$Numeral.Nomen)
Folge4
##
## Num+N
## SOV 6
## SVO 20
mosaicplot (Folge4
, xlab = "Wortfolgen"
, ylab = "Wortstellung von Numerale und Nomen"
, main = "Zusammenhang zwischen den Wortfolgen und
den Wortstellungen der Numerale und Nomen ")
chisq.test(Folge4)
##
## Chi-squared test for given probabilities
##
## data: Folge4
## X-squared = 7.5385, df = 1, p-value = 0.00604
t.test(Folge4)
##
## One Sample t-test
##
## data: Folge4
## t = 1.8571, df = 1, p-value = 0.3145
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## -75.94343 101.94343
## sample estimates:
## mean of x
## 13
Kritik In vielen Sprachen sind die Bedeutung von jedem Wort nicht klar markiert oder geschrieben, wie Persisch, Koreanisch. Man kann nur mit Wörterbuch und Google Übersetzer die Bedeutung vom einzelnen Wort raussuchen, aber meistens ist man unsicher. Daher kann man nur die Art von Wort feststellen, nicht die genaue Bedeutung und Feinheit.
Satz 1: Ich koche Suppe. In Vielen Sprachen wird der Subjekt nicht eingegeben, wenn es “ich” ist. “Ich” als Subjekt wird in der Endung von Verb makiert.
Kritik: 1 Nur mit ein paar Sätzen von Übersetzungen kann man nicht alle Variationen von einer Sprache bekommen, sondern nur die passende Form von diesem Satz. Das bedeutet noch lange nicht, dass andere Form in dieser Sprache nicht gibt.
2 Die im Text vergleichende Reihfolgen sind auch nicht unbedingt so ausgedrückt in der Sprache in allen Ausdrückssituationen.
Jedoch gibt es uns eine gute Überblick von Sprachen der Welt, dass die Sprache sehr vielfältig sind und doch einen Zusammenhang mit einandern haben.
Wenn man die Wortstellung mit diesen fünf Sätzen über diese erhobenen 26 Sprachen diskutieren, bekommt man eigentlich nicht alle Wortstellungsmöglichkeiten von diesen Sprachen. Eine Ausnahme ist zum Beispiel Chinesisch, die Wortstellung im Chinesischen kann sowohl “Subjekt-Verb-Objekt (SVO)” sein, als auch “Subjekt-Objekt-Verb (SOV)” sein. Die Wortfolge im chinesischen Satz kann die Bedeutung von Satz stark ändern, wie in folgenden Sätzen nach Jiang (2009):
Subjekt + Negation + Verb + Objekt Sichuan ren bu pa la Sichuan person not fear spicy “Sichuaners do not (fear their food) being spicy.”
Subjekt + Objekt + Negation + Verb Hubei ren la bu pa Hubei person spicy not fear “(Their food) being spicy is not fearful matter to Hubeiners.”
Subjekt + Verb + Negation + Objekt Hunan ren pa bu la Hunan person fear not spicy “Hunaners fear that (their food) is not spicy.”
Wortstellung im Sprachvergleich: (deutsch-niederländisch-polnisch-ungarisch) [M]. Julius Groos, 2001.
Nachschlagen von R: https://rseek.org